header%20ipynb.png

Hands-On

Hands-On ini digunakan pada kegiatan Microcredential Associate Data Scientist 2021

Memulai Python!

Dapat menuliskan keterangan kode menggunakan Markdown

In [ ]:
print("Hello world!")   # mode skrip
In [ ]:
height = 1.84
In [ ]:
tall = True
In [ ]:
height1 = 1.84
In [ ]:
height2 = 1.79
In [ ]:
height3 = 1.82
In [ ]:
height4 = 1.90

Masalah :

  • Terlalu banyak data masukan untuk tipe data yang sama
  • Tidak nyaman
  • Solusi: Python List
In [ ]:
[1.84, 1.79, 1.82, 1.90, 1.80]
In [ ]:
height = [1.84, 1.79, 1.82, 1.90, 1.80]
In [ ]:
height
In [ ]:
famz = ["Abe", 1.84, "Beb", 1.79, "Cory", 1.82, "Dad", 1.90]
In [ ]:
famz
In [ ]:
weight = [66.5, 60.3, 64.7, 89.5, 69.8] 
In [ ]:
weight
In [ ]:
weight / height ** 2 

Solusi: NumPy

  • Library dasar untuk perhitungan saintifik (scientific computing) dengan Python (https://numpy.org/)
  • Alternatif untuk Python List: Numpy Array untuk n-dimensi
  • Mudah digunakan dan bersifat open source
  • Jika library belum terpasang, tuliskan perintah instalasi: pip install numpy
  • Kemudian impor: import numpy as np
In [ ]:
import numpy as np
In [ ]:
np_height = np.array(height)
In [ ]:
np_height 
In [ ]:
np_weight = np.array(weight)
In [ ]:
np_weight
In [ ]:
bmi = np_weight / np_height ** 2
In [ ]:
bmi

Untuk melihat fungsi lain pada NumPy, gunakan perintah np.< TAB >

In [ ]:
np.
In [ ]:
np_height = np.array([1.84, 1.79, 1.82, 1.9, 1.8])
In [ ]:
np_weight = np.array([66.5, 60.3, 64.7, 89.5, 69.8])
In [ ]:
type(np_height)
In [ ]:
type(np_weight)
In [ ]:
np_2d = np.array([[1, 2, 3, 4, 5], [6, 7, 8, 9, 10]])
In [ ]:
np_2d
In [ ]:
np_2d.shape

SciPy

  • SciPy (dibaca “Sigh Pie”) merupakan library yang bersifat open source dan tersedia di https://www.scipy.org/
  • SciPy dibangun untuk untuk bekerja dengan NumPy array dan menyediakan kumpulan algoritma numerik, termasuk pemrosesan sinyal, optimasi, statistika, dan library Matplotlib untuk visualisasi data.
  • Jika library belum terpasang, tuliskan perintah instalasi: pip install scipy

Pandas

  • Pandas (Panel Data) merupakan library popular di Python yang digunakan untuk data structure dan data analysis
  • Bersifat open source dan tersedia di https://pandas.pydata.org/
  • Pandas sangat berkaitan dengan NumPy
  • Jika library belum terpasang, tuliskan perintah instalasi: pip install pandas
  • Kemudian impor: import pandas as pd
In [ ]:
#  series
np.array([1, 2, 3, 4, 5])
In [ ]:
# DataFrame
np.array([[1, 2], [3, 4]])
In [ ]:
import pandas as pd
In [ ]:
Tab = pd.read_csv("Tab.csv")
In [ ]:
Tab
In [ ]:
Tab["Negara"]
In [ ]:
Tab.Ibukota

Matplotlib

  • Matplotlib adalah library Python untuk visualisasi data dengan dua dimensi
  • Bersifat open source dan tersedia di https://matplotlib.org/
  • Matplotlib berkaitan dengan NumPy dan Pandas
  • Jika library belum terpasang, tuliskan perintah instalasi: pip install matplotlib
  • Kemudian impor: import matplotlib.pyplot as plt
In [ ]:
import matplotlib.pyplot as plt
In [ ]:
year = [1980, 1990, 2000, 2010, 2020]
In [ ]:
price = [2.5, 7.6, 9.7, 15.8, 22.9]
In [ ]:
plt.plot(year, price)
plt.show()
In [ ]:
plt.scatter(year,price)
In [ ]:
plt.bar(year,price)
In [ ]: